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摘 要 :【 目 的 】 对 比分 析 预 印 本 与 期 刊 相似 主题 的 区 别 与 联系 ， 以 新 冠 疫情 主题 为 例证 明 二 


者 在 研究 热点 与 侧重 上 存在 互补 .【 方 法 】 本 文采 用 BERTopic 主题 分 析 模 型 ， 并 提出 了 二 维 


象限 主题 对 比 法 , 从 热度 、 影 响 两 个 维度 对 预 印 本 与 期 刊 两 个 来 源 的 相似 热点 主题 进行 对 比 。 


【结果 】 分 析 bioRxiv、medRxiv、Scopus 平台 上 新 冠 疫 情 相 关 文 献 共 约 七 万 条 ， 对 比 预 印 
本 和 期 刊 各 个 维度 的 主题 分 布 情况 ， 发 现 以 下 规律 : 1) 主题 热度 方面 ， 预 印 本 更 偏向 医学 


层面 ， 期 刊 更 偏向 社会 层面 ，2) 主题 影响 方面 ， 预 印 本 更 偏向 预防 主题 ， 期 刊 更 偏向 病毒 
传播 主题 ; 3) 预 印 本 和 期 刊 在 热度 和 影响 力 方面 有 部 分 重 回 主题 ， 如 疫苗 相关 主题 , 4) 预 
印 本 中 有 期 刊 中 所 没有 的 特有 的 热点 主题 ， 如 病毒 变异 等 结论 】 总 体 来 看 ， 预 印 本 的 主 
题 更 偏向 理论 与 学 术 ， 而 期 刊 主题 更 偏向 实践 与 社会 ， 预 印 本 主题 在 原理 方面 分 支 更 细致 ， 
而 期 刊 主题 在 社会 层面 涉及 面 更 广 ， 二 者 在 内 容 方面 可 以 形成 有 效 互 补 。 
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Abstract: [Objective] To compare and analyze the differences and connections between preprints 
and periodicals on similar topics, and take the COVID-19 topic as an example to prove that the two 


are complementary in research hotspot and emphasis. [Methods] In this paper, the BERTopictopic 
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analysis model was adopted and the two-dimensional quadrant method was combined to compare 
the similar hot topics of preprint and periodical sources from two dimensions of heat and influence. 
[Results] About 70,000 literatures related to COVID-19 on bioRxiv medRxiv and Scopus were 
analyzed. The following rules were found: 1) In terms of topic popularity preprints were more 
medical, while periodicals were more social; 2) In terms of topic impact, preprints are more likely 
to focus on prevention, while periodicals are more likely to focus on virus transmission; 3) Preprints 
and periodicals have partially duplicated topics in terms of popularity and impact, such as vaccine- 
related topics; 4) There are special hot topics in the preprint that are not in the periodical, such as 
virus mutation. [Conclusion] In general, the preprint topics are more theoretical and academic, 
while the periodical topics are more practical and social. The preprint topic is more detailed in 
principle, while the periodical topic is more extensive in society, and the two can effectively 


complement each other in content. 
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1 引言 

随 着 开放 科学 的 发 展 ， 预 印 本 Preprints〉 作 为 一 种 区 别 于 学 术 期 刊 的 科学 
出 版 物 逐 渐 被 更 多 读者 认可 。 预 印 本 是 指 未 在 同行 评议 的 学 术 期 刊 上 正式 出 版 的 
科研 论文 手稿 四。 根据 Ross 等 人 的 研究 ， 自 1992 年 开放 科学 运动 的 兴起 ， 预 印 
本 的 发 展 进入 扩张 期 四， 以 学 界 自治 为 基础 的 预 印 本 学 术 交 流 模式 正 逐 渐 改 变 传 
统 的 以 期 刊 为 主体 的 单一 学 术 交 流 模式 名 。 唐 耕 砚 提出 预 印 本 平台 缩短 了 科学 交 
流 时 滞 ， 促 进 科 学 交流 体系 的 去 中 心 化 由 ， 认 为 预 印 本 改变 了 学 术 出 版 模式 ， 繁 
荣 了 学 术 交 流 回 。 预 印 本 与 期 刊 相 辅 相 成 、 优 势 互补 ， 共 同 构成 当下 重要 的 学 术 
交流 途径， 许多 著名 的 研究 成 果 ， 如 庞 加 莱 猜 想 的 证 明 回 、Google 的 BERT 模型 
等， 甚至 专门 发 表 在 预 印 本 平台 

大 量 预 印 本 及 其 特点 相关 的 研究 归纳 了 预 印 本 在 学 术 交 流 中 的 作用 与 优势 
所 在 。 刘 菊 红 外 通过 案例 分 析 ， 认 为 开放 获取 、 先 见 优势 、 质 量 歧 视 等 特点 使 得 
有 预 印 本 的 论文 更 具 引 用 优势 。 徐 诺 趾 等 人 总 结 了 预 印 本 的 特点 ， 即 时 效 性 强 、 
开放 获取 、 评 审 透明 多 元 等 ， 认 为 预 印 本 可 以 发 掘 优质 稿 源 、 缩 短评 审 周期 、 创 
新 评审 方式 。 唐 耕 砚 外 认为 预 印 本 可 以 弥合 科学 交流 的 时 滞 鸿 沟 ， 也 是 强调 了 速 


度 优 势 。 周 阳 6 总 结 了 预 印 本 的 四 个 优势 ， 即 避免 审 稿 偏见 、 发 表 速 度 快 、 可 
修改 、 提 供 首 发 证 明 。 汪 庆 呈 等 分 析 多 个 主流 平台 的 预 印 本 ， 认 为 预 印 本 有 出 
版 速度 快 、 开 放 融 合 、 格 式 灵 活 、 审 核 指标 多 维 等 特点 。 总 而 言 之 ， 现 有 研究 提 
及 预 印 本 的 特点 与 优势 ， 主要 有 两 大 类 : 一 是 没有 同行 评议 带 来 的 速度 优势 ， 即 
弥合 时 滞 ， 方 便 交 流 ; 二 是 发 表 形 式 灵 活 带 来 的 内 容 优势 ， 即 开放 获取 ， 公 开 评 
议 ， 避 免 偏见 ， 这 些 优势 使 得 预 印 本 在 学 术 交 流 中 发 挥 重 要 作用 。 

然而 ， 现 有 研究 大 多 强调 预 印 本 的 速度 优势 能 够 与 期 刊 的 质量 优势 形成 互补 ， 
却 忽 视 对 预 印 本 内 容 的 深入 研究 。 预 印 本 没有 同行 评议 的 特点 不 仅 带 来 发 表 速 度 
快 的 优势 ， 也 使 得 内 容 更 加 自由 ,更 容易 出 现 创 新 的 观点 , 但 质量 隐患 一 直 是 阻 
碍 预 印 本 内 容 相 关 研究 的 绊脚石 , 主要 原因 是 非 学 术 或 伪 学 术 论 文 混 入 预 印 本 平 
台 的 现象 , 影响 了 公众 对 预 印 本 的 信任 度 叹 。 随 着 预 印 本 平台 质量 控制 机 制 的 完 
善 n012 3, 预 印 本 的 质量 已 经 今 非 昔 比 , 许多 研究 也 开始 研究 预 印 本 的 内 容 特 征 ， 
并 论证 其 可 靠 性 。 主 要 方法 是 对 比 预 印 本 与 其 正式 出 版 版 本 的 修改 情况 ， 比 较 一 
臻 性、 关键 研究 特征 、 可 解释 性 等 (4161。 然 而 ， 这 些 研究 骨 在 证 明 预 印 本 与 期 刊 
的 联系 , 却 忽视 了 预 印 本 与 期 刊 整体 的 区 别 。 目 前 仍然 缺乏 对 预 印 本 和 期 刊 在 相 
似 主题 中 研究 内 容 、 研 究 热 点 、 影 响 力 等 方面 的 深入 研究 。 

要 对 比 预 印 本 与 期 刊 ， 文 献 数量 较 多 、 能 开放 获取 的 新 型 冠状 病毒 肺炎 疫情 
《COVID-19) 相关 主题 是 一 个 很 好 的 研究 案例 。 在 新 冠 疫情 期 间 ， 以 bioRxiv、 
medRxiv 为 代表 的 医学 预 印 本 平台 适应 了 对 学 术 成 果 快 速 、 便 捷 交 流 的 需求 ， 迎 
来 发 展 的 高 峰 期 。 刘 春 丽 47 等 人 证 明了 bioRxiv 自 存档 在 被 引 次 数 、 社 会 关注 度 、 
临床 转化 潜力 方面 的 优势 , 更 多 科学 家 选择 率先 将 成 果 发 表 在 预 印 本 平台 上 ， 
此 疫情 主题 的 预 印 本 数量 较 多 。 期 刊 方面 , 医学 领域 的 出 版 机 构 与 平台 出 台大 量 
政策 , 鼓励 学 术 成 果 的 开放 获取 , 缩短 出 版 流程 .Homolak 在 研究 中 统计 PubMed、 
Scopus 平台 上 2020 年 的 文章 发 表 时 滞 ， 发 现 COVID-19 相关 文献 发 表 时 滞 极 短 
Ha， 因 此 疫情 主题 的 期 刊 文献 数量 较 多 且 便 于 获取 。 要 对 比 研究 预 印 本 与 期 刊 ， 

选择 能 够 开放 获取 且 数 量 较 多 的 新 冠 疫情 主题 的 文献 作为 研究 对 象 是 合理 的 。 
疫情 期 间 的 两 个 主要 的 学 术 交 流 途 径 ， 预 印 本 与 期 刊 ， 在 发 表 速 度 与 研究 质 

量 方面 各 有 所 长 , 但 关于 其 内 容 方面 差异 的 研究 较 少 。 探 究 预 印 本 与 期 刊 在 相似 

研究 主题 上 的 联系 与 差异 ,归结 各 自 的 偏好 与 特长 所 在 ,可 以 更 好 地 发 挥 二 者 在 
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学 术 交 流 中 的 作用 。 对 此 ， 本 文 以 新 冠 疫情 主题 为 例 ， 选 取 bioRxiv、medRxiv、 
Scopus 平台 文献 作为 预 印 本 与 期 刊 的 代表 ， 使 用 BERTopic 主题 分 析 方 法 ， 从 热 
度 、 影 响 两 个 维度 ， 对比 预 印 本 和 期 刊 各 自 偏 向 的 研究 主题 ,探索 预 印 本 的 特点 
所 在 ， 为 期 刊 预 印 本 更 好 地 合作 互补 提供 参考 。 
2 相关 工作 

目前 关于 COVID-19 文献 的 研究 , 主要 将 研究 重点 放 在 传统 文献 计量 上 。2020 
年 ， 甘 登 辉 M9 等 人 以 COVID-19 预 印 本 为 研究 对 象 ， 主 要 从 时 间 分 布 、 学 术 与 社 
会 影响 力 等 方面 进行 分 析 , 发 现 其 发 文 量 在 2020 年 1 月 26 日 后 开始 增长 、 高 影 
响 力 预 印 本 中 bioRxiv 平台 的 文献 占 比 较 大 等 规律 。 同 年 李 爱 花 2 等 人 基于 文献 
计量 学 方法 分 析 COVID-19 研究 现状 ， 针 对 国内 外 期 刊 、 预 印 本 多 种 数据 源 ， 进 
行 时 间 分 布 、 国 家 机 构 分 布 、 研 究 热点 关键 词 聚 类 等 分 析 。 该 研究 在 传统 文献 计 
量 学 方面 较为 全 面 , 但 对 内 容 方面 的 分 析 只 有 关键 词 聚 类 , 且 并 未 研究 预 印 本 文 
献 。2022 年 ，Santos?1 等 人 基于 科学 计量 指标 ， 从 研究 人 员 、 机 构 等 角度 ， 对 
COVID-19 科研 成 果 进 行 描述 上 与 时 间 上 的 分 析 , 发 现 期 刊 仍 是 最 常见 来 源 , 而 预 
印 本 的 使 用 比例 也 越 来 越 多 。 现 有 研究 在 传统 文献 计量 学 方面 的 分 析 较 为 全 面 ， 
无 论 是 时 间 分 布 . 期 刊 分 布 . 国 家 分 布 还 是 影响 力 , 都 可 以 为 研究 人 员 提 供 参 考 ， 
但 对 文献 的 文本 内 容 与 主题 的 研究 较 少 , 更 多 的 是 以 推 特等 社交 媒体 文本 为 研究 
对 象 ， 方 法 也 多 是 情感 分 析 ， 如 接种 疫苗 的 公众 观点 分 析 C 等 。 对 于 疫情 相关 文 
献 ， 尤 其 是 预 印 本 的 内 容 与 主题 仍 需 进一步 研究 。 

关于 某 一 领域 的 热点 主题 的 研究 已 经 较为 成 熟 ， 目 前 主要 有 两 种 研究 思路 ， 
一 是 传统 文献 计量 学 方法 ， 二 是 主题 模型 。 

传统 文献 计量 学 方法 主要 有 词 频 分 析 、 共 词 分 析 、 热 词 分 析 等 。 词 频 分 析 简 
单 地 考虑 词 频 ， 忽 略 了 词 的 含义 及 联系 ， 也 就 无 法 判断 哪些 词 归属 于 一 个 主题 ; 
词 分 析 则 考虑 了 文献 集中 词汇 共 现 的 情况 ,通过 构建 共 词 矩阵 ， 进 一 步 通过 聚 
类 等 方法 识别 主题 2。 热 词 发 现 的 方法 大 致 分 为 两 类 ， 一 是 基于 规则 的 方法 ， 即 
结合 领域 专业 知识 构建 规则 来 进行 识别 , 如 王 志 涛 等 基于 词典 与 规则 分 析 微 博文 
本 的 方法 59; 二 是 基于 统计 的 方法 ， 需 要 在 语料库 上 进行 训练 ， 较 前 一 种 方法 可 
移植 性 强 , 但 存在 准确 率 方面 的 不 足 吴 。 但 这 些 方法 都 存在 两 个 共有 的 缺点 ， 一 
是 片面 强调 高 频 词 ， 二 是 忽略 了 文本 的 语义 信息 。 
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主题 模型 可 以 很 好 地 弥补 传统 文献 计量 学 方法 的 不 足 ， 也 可 以 分 为 两 大 类 : 
一 是 基于 词 袋 的 模型 ， 以 LDA 模型 R81 为 代表 。 该 类 方法 基于 “文档 -单词 ”的 共 
现 频率 特征 抽取 主题 , 但 忽视 词汇 之 间 的 上 下 文 语义 关系 。 第 二 类 是 基于 预 训练 
词 向 量 答 入 的 模型 ,代表 模型 有 Top2Vec 等 。 该 类 方法 假定 主题 相似 的 文档 在 语 
义 空 间 中 位 置 相近 ， 但 基于 密度 的 文档 聚 类 与 基于 中 心 的 主题 词 采 样 产 生 了 矛盾， 
会 导致 误 采 样 。BERTopic ?7 模型 采样 基于 文档 集合 的 C-TF-IDF 算法 ， 从 每 个 簇 
中 选取 词 项 来 构建 主题 ， 克 服 了 上 述 问 题 。 

3 研究 框架 
本 文 研究 的 总 体 架构 如 图 3-1 所 示 。 研 究 框架 分 为 两 大 模块 :数据 获取 模块 ， 
数据 分 析 模 块 。 

(1) 数据 获取 模块 的 功能 是 数据 采集 和 数据 清洗 。 数 据 采集 借助 网 站 API、 
搜索 结果 导出 等 方法 ， 获 取 文 献 的 链接 列表 ， 并 进一步 得 到 包含 DOol、 标 题 、 摘 
要 等 信息 在 内 的 元 数据 以 及 altmetrics 信息 ; 数据 清洗 主要 是 去 除 不 完整 的 数据 ， 
并 基于 DOI 对 文献 元 数据 与 altmetrics 数据 进行 匹配 。 最 终 获 取 来 源 bioRxiv 与 
medRxiv 的 预 印 本 数据 、 来 源 Scopus 的 期 刊 数据 ， 并 从 altmetric.com 网 站 获 
取 每 条 文献 数据 对 应 的 altmetrics 信息 。 

(2) 数据 分 析 模 块 的 功能 是 模型 构建 和 热点 对 比 。 模型 构建 是 对 经 过 预 处 理 
的 预 印 本 与 期 刊 数据 分 别 构建 BERTopic 模型 ， 调 整 参数 ， 获 取 二 者 各 自 的 主题 
分 布 情况 ;热点 对 比 主要 是 通过 二 维 象限 主题 对 比 法 ， 从 热度 、 影 响 两 个 维度 ， 
分 析 预 印 本 、 期 刊 的 热点 主题 ,并 对 比 其 相似 与 不 同 之 处 ,为 预 印 本 与 期 刊 的 合 
作 提出 建议 。 
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4 研究 方法 

本 文中 的 研究 方法 主要 由 两 个 部 分 组 成 。 第 一 ， 在 数据 分 析 中 的 主题 分 析 部 
分 选择 BERTopic 模型 。 第 二 ， 在 对 期 刊 和 预 印 本 的 热点 主题 比较 分 析 中 使 用 二 
维 象 限 主 题 对 比 法 。 
4.1 BERTopic 模型 

BERTopic 模型 如 图 4-1 所 示 。 该 模型 弥补 了 基于 词 袋 的 主题 模型 忽视 词汇 上 
下 文 语 义 关 系 的 缺点 , 又 解决 了 基于 预 训练 词 棋 入 模型 使 用 不 同方 法 进行 文档 聚 
类 与 主题 采样 导致 的 误 采 样 问题 ， 使 得 结果 主题 内 的 词 项 在 语义 上 更 加 相关 。 该 
方法 主要 分 为 四 个 模块 , 分 别 是 嵌入 模块 、 降 维 模块 、 聚 类 模块 、 主 题 表 征 模 块 。 

《1) 嵌入 模块 主要 目的 是 通过 预 训练 语言 模型 来 获得 文档 圣 入 向 量 , 这 里 使 
用 默认 的 BERT 预 训练 模型 ， 即 Sentence-BERT 架构 ; 

(2) 降 维 模块 用 于 降低 嵌入 的 维度 , 方便 后 续 聚 类 , 这 里 采用 的 是 一 种 非 线 
性 降 维 算法 UMAP ， 可 以 保留 更 多 局 部 特征 ， 且 速度 较 快 ; 

(3) 聚 类 模块 采用 基于 密度 的 聚 类 算法 HDBSCAN， 对 降 维 后 的 文档 向 量 进 


行 聚 类 ， 方 法 原文 中 把 降 维 与 聚 类 算 作 一 个 模块 ， 此 处 分 开 介 绍 以 便 展 示 ; 
(4) 模型 的 主题 表征 采用 修改 后 的 TF-IDF 算法 ,， 即 C-TF-IDF， 该 算法 基于 上 
一 步 的 聚 类 结果 ， 为 每 个 文档 集群 分 配 一 个 主题 ， 如 公式 〈4-1) 所 示 P7。 


4 
Wre 一 tfte log(1 十 页) ( 4-1 ) 


其 中 词 项 的 频率 tf。 指 的 是 词 项 t 在 文档 集群 c 中 的 频率 ，A 为 每 个 集群 
的 平均 词 数 。 通 过 BERTopic 方法 分 别 代入 预 印 本 与 期 刊 的 标题 摘要 文本 ， 得 到 
各 自 的 文档 -主题 分 布 与 主题 - 词 项 分 布 情况 ， 以 供 后 续 对 比分 析 。 


标题 + 摘要 文本 


嵌入 
Sentence — BERT 


降 维 
UMAP 


聚 类 


HDBSCAN 


表征 
C—TF— IDF 


文档 一 主题 分 布 
主题 一 词 项 分 布 


图 4-1 BERTopic 方法 的 主要 模块 

4.2 二 维和 象限 主题 对 比 法 

本 文 提 出 了 二 维 象限 主题 对 比 法 ， 可 以 直观 地 判断 主题 的 类 型 ， 如 图 3-3 所 
示 。 二 维 象限 法 曾 由 Wang 等 人 用 于 期 刊 话语 权 研 究 2。 本 文 基于 具体 情况 提出 
了 二 维 象限 主题 对 比 法 , 用 于 主题 的 对 比 。 本 文 将 主题 的 影响 度 和 热度 作为 衡量 
指标 , 分 别 为 四 个 象限 的 主题 进行 定义 ,第 一 象限 为 高 影响 高 热度 的 “热点 主题 ”， 
即 发 展 较为 成 熟 ， 有 大 量 文献 支持 与 影响 力 ;， 第 二 象限 为 “新 兴 主 题 ” 即 相 关 
研究 大 量 增长 ， 而 新 文献 的 影响 力 尚且 不 高 ; 第 三 象限 为 “普通 主题 ” 该 象限 
的 主题 数量 最 多 ， 但 影响 力 与 文献 数量 都 一 般 ; 第 四 象限 为 “经 典 主 题 ” 即 文 
献 数量 不 多 ， 但 影响 力 较 大 。 当 一 个 主题 热度 增加 ， 大 量 研究 出 现 ， 就 会 由 “ 普 
通 主题 ”跃迁 到 “新 兴 主 题 ”， 随 着 时 间 的 推移 ， 一 些 文献 得 到 大 量 关 注 ， 主 题 
的 影响 力 提 高 , 转变 为 “热点 主题 ”; 随 着 研究 的 变化 , 热点 主题 也 会 热度 下 降 ， 
一 些 仍 有 影响 力 的 文献 则 精炼 为 “经 典 主题 ”其 他 的 则 回归 普通 主题 之 中 。 


和 。 景 ? 员 〈 关 注 度 ) 


图 4-2 “热度 -影响 ”二 维 象限 法 
为 了 将 不 同 主题 放 入 二 维 象限 图 中 ， 本 文 提 出 公式 〈4-2) 来 对 热度 
个 维度 的 数值 进行 归 一 化 。 热 度 定 义 为 该 主题 文献 的 数量 , 影响 即 该 主 


、 影 响 两 


题 所 有 文 


献 的 平均 关注 度 分 数 AAS (Altmetric Attention Score )， 妆 一 化 采用 的 方法 是 “ 减 


去 平均 数 ， 除 以 极 大 值 ”， 使 得 数值 分 布 在 [-1,1] 之 间 。 


a (4-2) 


max(s—5) 


5 实验 结果 


5.1 数据 介绍 


本 文 的 研究 对 象 为 2020 年 至 2022 年 COVID-19 相关 的 期 刊 与 预 印 本 ， 期 
刊 来 源 于 Scopus 数据 库 , 预 印 本 来 源 于 bioRxiv、medRxiv 数据 库 , altmetrics 信 


息 获 取 自 altmetric.com 网 站 。 采 和 集 时 间 为 2023 年 4 月 5 日 。 


预 印 本 数据 bioRxiv 官网 上 COVID-19 相关 文献 合集 1, 通过 疏 虫 获取 该 合集 


中 所 有 文献 的 网 址 、DOI 号 ， 再 借助 官网 的 API 获取 所 有 文献 的 标题 、 


摘要 、 作 


者 等 信息 ; 期 刊 数据 来 源 于 Scopus 数据 库 ， 以 “COVID-19” 为 检索 词 在 标题 、 
摘要 中 检索 ， 并 通过 筛选 器 进行 精炼 搜索 ,获取 COVID-19 相关 的 已 发 表 期 刊 文 
章 元 数据 预 印 本 与 期 刊 对 应 的 altmetrics 信息 获取 自 altmetric.com 网 站 提供 
的 APl， 提 供 文 献 DOI 号 逐一 匹配 获取 。 去 除 无 效 信息 后 ， 最 终 获取 预 印 本 数 
据 26711 篇 、 期 刊 数据 55233 篇 ， 以 及 各 自 对 应 的 altmetrics 信息 。 部 分 期 刊 信 
息 齐 全 但 无 法 查询 到 altmetrics 信息 , 即 未 在 社交 媒体 中 提 及 , AAS 分 数 记 为 0。 


1 文献 合集 : https://connect.bioRxiv.org/relate/content/181 


表 5-1 预 印 本 与 期 刊 文献 元 数据 表 


来 源 数量 DOIL ”标题 ”摘要 Altmetrics 
bioRxiv 6610 V V 6604 V 
medRxiv 20188 V V 20107 V 
Scopus 55233 ~ ~ ~ 41019 


注 : 不 齐全 的 地 方 填 入 具体 数字 ,“ v ”表示 齐全 


5.2 预 印 本 热点 主题 分 析 
(1) 预 印 本 高 热度 主题 分 析 

将 预 印 本 数据 代入 模型 自动 聚 类 后 ， 共 获得 60 个 主题 。 首 先 以 每 个 主题 的 
文献 数量 作为 热度 指标 ， 列 出 预 印 本 前 10 个 高 热度 研究 主题 。 如 表 5-1 所 示 。 

数量 最 多 的 主题 0 是 “病毒 传播 模型 ”(Transmission-Model)， 根 据 相 关 词 项 
与 文档 可 以 判断 ， 该 主题 偏向 宏观 数据 统计 、 传 播 模 型 建立 与 预测 ， 主 题 1 是 
“预防 与 检测 ”(Testing) 相关 ， 以 核酸 检测 等 为 主 ; 主题 2“ 基因 组 ”(Genome) 
是 对 病理 机 制 研究 ， 该 主题 还 包含 大 量 病毒 变异 相关 词 项 , 可见 病毒 变异 是 该 主 
题 兴 起 的 重要 原因 ; 主题 3 是 “心理 学 ”(Psychology) 相关 文献 ， 主 要 涉及 疫情 
期 间 的 心理 健康 、 精 神 压力 等 问题 ; 主题 4 是 “药物 ”(Drug) 相关 文献 ， 主 要 
涉及 抗 病毒 药物 的 研制 ;主题 5 是 “疫苗 接种 态度 ”(Vaccine-Attitude )， 涉 及 接 
种 疫苗 的 犹豫 、 对 疫苗 的 接受 程度 等 研究 ;主题 6“ 和 蛋白 质 ”(Protein) 与 主题 2 
同样 属于 病毒 机 制 研究 ， 涉 及 和 蛋白质 受 体 、 刺 突 和 蛋白 等 ; 主题 7 是 “疫情 数据 统 
计 ”(Statistics)， 即 疫情 期 间 的 死亡 率 等 数据 统计 与 分 析 ; 主题 8 同样 涉及 病毒 
传播 , 但 更 偏向 社会 层面 , 命名 为 “病毒 传播 -社会 ”(Transmission-Social)， 讨 论 
从 传播 途径 控制 病毒 的 传播 , 涉及 口罩 、 空 气 传播 等 关键 词 ; 主题 9 同样 为 疫苗 
相关 ， 但 偏向 疫苗 研制 ， 命 名 为 “疫苗 研制 ”(Vaccine-Development)。 


表 5-1 预 印 本 高 热度 主题 


ID 主题 释义 词 项 计数 


model, epidemic, number, cases, time, 


Transmission- | 病毒 传播 《〈 偏 统 


0 countries, transmission, measures， 2569 


Model 计 、 建 模 ) 


spread, population 


igg, antibodies, antibody, 
. 预防 与 检测 (如 四 本 
Testing 和 seroprevalence, infection, positive, 1485 
核酸 检测 ) 
igm, test, children, anti 
基因 组 相关 病理 mutations, genome, variants, 
Genome 机 制 (包含 病毒 sequences, sequencing, genomic, 1393 
变异 ) variant, mutation, lineages 
I mental, health, mental health, anxiety, 
Psychol 人 d i ial, psychological 991 
sychology ek epression, social, psychological, care, 
间 心 理 健康 ) 
stress, symptoms 
mpro, antiviral, drug, protease, 
Drug 药物 等 治疗 手段 | inhibitors, drugs, activity, compounds, 591 
replication, treatment 
vaccine, vaccination, hesitancy, 
Vaccine- 疫苗 相关 〔 偏 接 vaccinated, vaccines, vaccine ea 
Attitude 种 态度 ) hesitancy among, participants, 
uptake, acceptance 
ace2, binding, protein, spike, rbd, 
. 和 蛋白质 相关 病理 . . 
Protein 机 制 receptor, spike protein, domain, 553 
affinity, receptor binding 
数据 统计 (死亡 | deaths, mortality excess, countries, 
Statistics 网 453 
率 等 ) death, age, rates, fatality, population 
mask, masks, air, aeroso), 
Transmission- | 病毒 传播 (社会 
transmission, face, airborne, aerosols, 417 
Social 层面 ) 
droplets, Ventilation 
ee dose, vaccine, vaccination, antibody, 
Vaccine- 疫苗 相关 〔 偏 疫 , , 
和 bnt162b2, mrna, igg, anti, responses, 356 
Development 苗 研 制 | ) 
second 


参考 PubMed 网 站 对 COVID-19 文献 的 分 类 标准 ?， 结 合 数据 的 具体 情况 ， 
一 步 归 纳 主 题 , 以 便 分 析 规 律 。 主题 0、 主 题 8 可 归纳 为 “传播 ”(Transmission)， 
即 对 病毒 传播 规律 的 研究 ， 主 题 1 的 核酸 检测 ， 主 题 5、 主 题 9 的 疫苗 都 可 以 作 
为 预防 的 一 个 部 分 , 可 归 类 为 “预防 ”(Prevention); 主题 2 的 基因 组 与 主题 6 的 
蛋白 质 可 归 类 为 “机 制 ”(Mechanism)， 即 病毒 原理 研究 ;主题 3 的 心理 学 与 主 
题 7 的 统计 可 归 类 为 “社会 ”(Society)， 即 社会 层面 的 统计 与 其 他 研究 ;主题 4 


进 


2 分 类 标准 : 


https://pubmed.ncbi.nIm.nih.gov/help/#covid19-articles 


药物 研制 可 视 作 治疗 的 一 部 分 ， 可 归 类 为 “治疗 ”(Treatment )。 

总 体 来 看 ， 预 印 本 的 高 热度 主题 中 ， 病 毒 的 “传播 “预防 “机制 ”的 研 
究 偏 多 。“ 传 播 ” 中 建 模 预测 最 多 , 社会 层面 防 控 其 次 ;“ 预 防 ” 中 核酸 检测 最 多 、 
疫苗 其 次 :“ 机 制 ” 中 基因 组 及 病毒 变异 最 多 ， 蛋 白质 其 次 。“ 治 疗 ^“ 社 会 ” 层 
面 研究 偏 少 。 

(2) 预 印 本 高 影响 主题 分 析 

以 每 个 主题 的 平均 AAS 分 数 为 影响 指标 ， 列 出 预 印 本 前 10 个 高 影响 主题 ， 
如 表 5-2 所 示 。 这 些 主题 关注 度 与 讨论 度 较 高 ， 可 以 体现 研究 的 重要 性 。 为 了 方 
便 区 分 ， 保 留 实验 结果 中 的 主题 号 作为 ID。 可 以 发 现 前 10 个 高 影响 主题 与 高 热 
度 主题 重合 度 较 小 ， 但 存在 部 分 内 容 相似 的 主题 。 

主题 39、 主 题 9、 主 题 56 均 为 疫苗 相关 主题 ， 根 据 对 相关 词 项 与 对 应 文档 
的 观察 , 主题 9 更 偏向 二 次 接种 (Vaccine-Second), 主题 56 更 偏向 病毒 变 体 (Vaccine- 
variant); 主题 27、 主 题 10 均 为 病毒 变异 相关 研究 ， 其 中 主题 27 面向 疫苗 研 和 
(Variant-Vaccination )， 主 题 10 更 综合 一 些 ; 主题 26 为 “临床 治疗 ”(Clinical)， 
相关 词 包含 临床 治疗 的 药物 与 有 机 化 合 物 ; 主题 41 为 “免疫 ”(Immune)， 涉 及 
记忆 细胞 、 抗 体 等 免疫 相关 病理 机 制 ， 主题 54 为 “动物 载体 ”(Transmission- 
Animal)， 即 病毒 传播 的 动物 载体 ， 主 题 55 偏向 “神经 学 科 ”(Neurology)， 涉 及 
大 脑 、 神 经 研究 ， 与 治疗 、 心 理学 均 有 关联 ; 主题 32 为 “心理 学 ”(Psychology) 
相关 ， 偏 向 认 知 心理 学 ， 即 社会 层面 的 心理 健康 研究 。 


表 5-2 预 印 本 高 影响 主题 


Cs 


ID 主题 释义 词 项 分 数 
a 疫苗 相关 dose, bnt162b2, vaccine, vaccination, 
accine- 
39 (mRNA 等 疫 | effectiveness, infection, ci, vaccinated, | 948.31 


Development i 
苗 研 发 ) mrna 


omicron, delta, variant, ba, infection， 


Variant- 病毒 变异 〈 面 
27 vaccination, omicron variant, ci, 551.22 
Vaccination “| 向 疫苗 研制 》 
compared 


hcq, hydroxychloroquine, patients, 


治疗 (临床 、 | | 
26 Clinical treatment, trials, chloroquine, group, 419.12 


药物 治疗 ) 


clinical, cq, azithromycin 


病毒 变异 〈 综 omicron, ba, variant, variants, 
10 Variant a a 334.3 
合 ) neutralizing, neutralization, delta, 


antibody omicron variant 


. i a dose, vaccine, vaccination, antibody, 
Vaccine- 疫苗 相关 二 


9 、 bnt162b2, mrna, igg, anti, responses, 325.34 
Second 次 接种 ) 
second 
病理 机 制 ( 记 memory, memory cells, cells, cell, 
41 Immune 忆 细 胞 、 抗 体 specific antibodies, responses， 321.64 
等 免疫 相关 ) vaccination, immune, antibody 


、 vaccine, variants, vaccination, 
Vaccine- 疫苗 相关 〈 病 
56 neutralizing, antibody, infection, 315.42 
Variant 毒 变 体 ) 
protection, mrna, vaccines, antibodies 


cats, deer, animals, animal, humans, 


Transmission - | 动物 (病毒 传 
54 species, mink, dogs, transmission, tailed | 290.56 


Animal 播 的 载体 ) 


deer 


brain, neurological, neurons, microglia, 


55 Neurology 神经 学 科 infection, cns, cells neuroinflammation, | 240.36 


neurological symptoms, nervous 


neurological, cognitive, patients, 


心理 学 (偏心 I 
32 Psychology symptoms, psychiatric, brain, disorders, 203.1 
里 与 认 知 ) 


De 


long, acute, mental 


与 前 一 小 节 类 似 ， 对 预 印 本 高 影响 主题 进行 归 类 。 主题 39、 主 题 9、 主 题 56 
的 疫苗 相关 研究 归 类 为 “预防 ”(Prevention); 主题 27、 主 题 10 的 病毒 变异 相关 
与 主题 41 的 免疫 相关 , 均 可 归 类 为 “机 制 ”《Mechanism); 主题 26 的 临床 治疗 、 
主题 55 的 神经 科学 都 可 以 计 入 “治疗 ”(Treatment); 主题 54 归 类 为 “传播 ” 
(Transmission); 主题 32 的 心理 学 方面 可 归 类 为 “社会 ”(Society)。 

总 体 来 看 ， 预 印 本 的 高 影响 力主 题 主 要 涉及 “预防 和 “机 制 ” 两 个 大 类 ， 其 
中 “预防 ”主要 是 关于 疫苗 的 研究 ， 而 “机 制 ” 主 要 是 病毒 变异 相关 。 对 比 高 热 
度 主题 ， 病 毒 “传播 ”相关 研究 虽然 数量 较 多 ， 但 文献 的 平均 影响 力 不 高 。“ 治 
疗 ” 层 面 的 研究 中 ， 药 物 研 制 主题 热度 高 ， 临 床 治疗 主题 影响 大 。“ 社 会 ”层面 
的 研究 在 热度 与 影响 方面 都 不 突出 ， 主 要 是 作为 其 他 研究 的 拓展 与 补充 而 存在 。 
5.3 期 刊 热点 主题 分 析 


(1) 期 刊 高 热度 主题 


将 期 刊 数据 代入 模型 自动 聚 类 后 ， 共 获得 122 个 主题 。 首 先 以 每 个 主题 的 文 


献 数量 作为 热度 指标 ， 列 出 期 刊 前 10 个 高 热度 研究 主题 。 可 以 发 现 热 点 主题 与 


预 印 本 差别 较 大 。 最 多 的 主题 为 “在 线 教育 ”COnline Learning)， 即 社会 层面 的 线 


上 教育 方面 的 研究 与 介绍 ; 


主题 1 与 预 印 本 热点 主题 一 致 ， 是 “病毒 传播 ” 


CTransmission)， 可 见 关于 病毒 传播 过 程 的 统计 与 研究 普遍 较 多 ; 主题 2 与 主题 
3 均 与 疫苗 有 关 。 主 题 2 偏向 疫苗 的 原理 与 研制 ， 命 名 为 “疫苗 研制 ”(Vaccine- 
Development); 主题 3 偏 问 民众 对 疫苗 的 态度 , 命名 为 “疫苗 接种 态度 ”(Vaccine- 


Attitude); 主题 4 为 “和 蛋白质”(CProtein )， 恨 
为 “在 线 健 康 ”(Telehealth )， 与 在 线 教育 一 村 


病毒 蛋白 质 相 关机 制 研究 ， 主 题 5 


EF 兴起 于 对 线 下 活动 的 管控 , 包含 线 


上 问 诊 等 相关 统计 与 研究 ; 主题 6 为 “运动 ”(Exercise), 与 在 线 教育 、 在 线 健康 


村 


是 以 核 


加 


表 5-3 期 刊 高 热度 主题 


, 属于 社会 层面 研究 , 即 面向 民众 疫情 期 间 的 生活 质量 ; 主题 必 检 测 兴 Testing) 
酸 检测 为 主 的 预防 手段 相关 研究 ; 主题 8“ 社 会 "(Society) 则 是 对 疫情 期 
间 社 会 层面 的 经 济 、 政 治 方面 的 总 体 研究 ， 主 题 9 “污染 ”(Pollution ) 主要 是 空 
气 污染 ， 与 病毒 传播 的 研究 相关 。 


让 


ID 主题 释义 词 项 计数 
students, online, education, teaching, 
Online 、 
0 在 线 教育 teachers, student, training, virtual, online | 1994 
Learning 
learning 
epidemic cases, mobility number, spread, 
1 | Transmission 病毒 传播 1711 
transmission, countries, time, models 
i ee | antibody, antibodies, vaccination, vaccine, 
Vaccine- 疫苗 (疫苗 
2 dose, anti, bnt162b2, neutralizing, 1467 
Development 研制 ) 
infection 
jj vaccination, hesitancy, vaccine hesitancy, 
Vaccine- 疫苗 接种 
3 vaccines, vaccinated, acceptance, uptake, 1177 
Attitude 态度 ) 
among, trust 
protein, compounds, protease, molecular, 
4 Protein 蛋白 质 1107 
mpro, docking, drug, ace2, inhibitors 
、 telehealth, care, visits, patient, services, 
5 Telehealth 在 线 健康 1003 
virtual, person, video, patients 
本 physical, food, activity pa, eating, weight, 
6 Exercise 运动 健康 998 
exercise, lockdown, changes 
、 、 hcws, infection, transmission, workers， 
7 Testing 预防 与 检测 728 
risk, testing, respiratory positive, staff 
8 Society 社会 〈 政 health, crisis, political social, policy, 714 


策 、 经 济 ) public economic world 


pm2, pollution, no2, air quality, lockdown, 


| 污染 (空气 | | 
9 Pollution a air pollution, emissions, concentrations, 699 
污染 ) 
pollutants 


期 刊 的 高 热度 主题 与 预 印 本 的 区 别 较 大 ， 可 以 发 现 主 题 0、 主 题 5、 主 题 6、 
主题 8 都 可 以 归 类 到 “社会 ”(Society)， 显 然 相 较 预 印 本 只 有 统计 、 心 理 等 层面 
的 研究 要 丰富 许多 ; 主题 1、 主 题 9 可 以 归 类 到 “传播 ”(Transmission )， 涉 及 病 
毒 的 传播 与 空气 质量 的 管控 ; 主题 2、 主 题 3 的 疫苗 相关 研究 、 主 题 7 核酸 检测 
相关 ， 都 可 归 类 到 “预防 ”(Prevention), 疫苗 相关 研究 的 数量 尤其 多 ; 主题 4 蛋 
白质 相关 可 以 归 入 “机 制 ”(Mechanism )， 相 较 预 印 本 的 包含 基因 组 、 蛋 白质 、 
免疫 系统 等 在 内 的 机 制 研究 , 期 刊 的 病理 机 制 研究 在 数量 上 占 比 较 少 总而言之 ， 
在 热度 方面 ， 期 刊 的 主题 更 偏向 社会 层面 ， 且 分 类 更 丰富 。 

(2) 期 刊 高 影响 主题 

以 每 个 主题 的 平均 AAS 分 数 为 影响 指标 ， 列 出 期 刊 前 10 个 高 影响 主题 。 与 
预 印 本 高 影响 主题 类 似 ， 主 题 107、 主 题 2 都 是 影响 力 较 高 的 疫苗 相关 主题 ， 其 
中 主题 107 更 偏向 疫苗 研制 中 的 试验 (Vaccine-Trial)， 主 题 2 比较 综合 ， 可 命名 
为 “疫苗 研制 ”(Vaccine-Development); 主题 73 则 涉及 疫情 期 间 的 “补给 ” 

(Supplement )， 与 治疗 层面 有 关 ， 不 过 更 偏向 社会 层面 的 研究 ， 主题 27 为 “ 临 
床 治疗 ”(Clinical)， 相 关 词 项 包含 了 许多 临床 药物 与 有 机 物 名 称 ; 主题 48、 主 题 
82、 主 题 57 均 为 病毒 传播 相关 主题 , 其 中 主题 48 更 强调 口音 等 社会 层面 的 管控 

《Social)， 其 他 则 偏向 空气 污染 (Contamination )、 气 溶胶 (Aerosol) 等 传播 渠道 
研究 ; 主题 22 为 “和 蛋白质 ”(Protein) 相关 病理 机 制 研究 ， 涉 及 了 基于 病毒 机 制 
进行 的 疫苗 研制 ; 主题 28 为 “神经 科学 ”(Neurology) 相关 ， 与 预 印 本 高 影响 主 
题 中 的 神经 科学 一 致 。 


表 5-4 期 刊 高 影响 主题 


ID 主题 释义 词 项 分 数 


ee 、 vaccination, vaccines, dose, vaccinated, 
107 | Vaccine-Trial | 疫苗 (研制 试验 ) 278.28 
safety, trial, placebo, efficacy, group 


deficiency, vitamin deficiency, zinc, 
73 | Supplement 补给 (缺乏 ) 274.33 
supplementation, levels, serum 


hydroxychloroquine, treatment, qtc, 
27 Clinical 治疗 (临床 ) chloroquine, patients, clinical, 245.93 


azithromycin, trials, prolongation 


Transmission- masks, wearing, face, face masks, mask 
48 传播 《〈 口 罩 等 ) 243.18 
Social wearing, face mask, faces, wear, public 


air, samples, contamination, 
Transmission- 2 
82 传播 《空气 污染 ) environmental, rna, transmission, 215.62 
Contamination 


surface, airborne, aerosols 


antibody, antibodies, vaccination, 
Vaccine- a 
2 疫苗 (接种 研制 》 vaccine, dose, anti, bnt162b2, 190.02 
Development 


neutralizing, infection 


ventilation, airborne, indoor, droplets, 
Transmission- a 
57 传播 ( 气 溶胶 ) transmission, aerosol droplet, 173.09 
Aerosol 
aerosols, risk 


于 neutralizing, antibodies, spike, binding， 
和 蛋白质 (病毒 变 | , | ; 
22 Protein ee antibody, variants, protein, vaccine, 153.03 
开 、 疫 田 人 研 制 | ) 


Vaccines 


manifestations, brain, neurological 
、 四 manifestations, patients, acute, 

28 Neurology 神经 科学 131.43 
encephalopathy, symptoms, 


neurologic, mri 


主题 107、 主 题 2 的 疫苗 相关 研究 可 以 归 类 为 “预防 ”(Prevention); 主题 73 
的 补给 可 以 归 入 “社会 ”(Society); 主题 27 的 临床 治疗 、 主 题 28 的 神经 科学 可 
以 归 入 “治疗 ”(Treatment); 主题 48、 主 题 82、 主 题 58 均 可 归 入 “传播 ” 
(Transmission); 主题 22 的 蛋白质 可 以 归 入 “机 制 ”(Mechanism)。 

可 以 发 现 ,“ 传 播 ” 层 面 的 研究 ,在 预 印 本 高 影响 主题 中 不 够 显著 , 却 在 期 刊 
中 占据 很 大 比重 ;以 疫苗 为 主 的 “预防 ” 在 期 刊 、 预 印 本 中 都 属于 高 影响 的 主 
题 ;“ 治 疗 ” 层 面 预 印 本 与 期 刊 一 致 ， 都 是 临床 相关 主题 影响 力 较 高 ， 蛋 白质 等 
病毒 的 “机 制 ” 相 关 研 究 在 在 期 刊 中 影响 力 较 小 ;“ 社 会 ”层面 的 研究 在 期 刊 中 
虽 数 量 较 多 ， 但 平均 影响 力 不 够 高 。 
5.4 预 印 本 与 期 刊 热度 -影响 二 维 象 限 分 析 

为 了 更 直观 地 展示 不 同 主题 在 “热度 -影响 ”两 个 维度 的 分 布 , 这 里 对 两 个 指 
标 进 行 归 一 化 处 理 后 展示 在 二 维 坐标 系 上 。 
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预 印 本 主题 如 图 5-1 所 示 。 可 以 发 现 大 部 分 主题 属于 低 影 响 低热 度 的 “普通 
主题 ” 热度 最 高 的 “新 兴 主 题 ” 是 “病毒 传播 模型 ”(Transmission-Model)， 该 
类 研究 在 疫情 期 间 大 量 增加 ， 大 多 由 在 预测 病毒 传播 与 疫情 发 展 规律 , 但 影响 力 
不 够 高 ， 影 响 最 大 的 “经 典 主题 ”为 “疫苗 研制 ”(Vaccine-Development)， 疫 苗 
相关 研究 包含 许多 主题 ， 该 细 分 主题 影响 力 偏 高 一 些 。 

高 影响 高 热度 的 “热点 主题 ” 有 主题 10“ 病 毒 变异 ”(Variant)、 主 题 9“ 疫 
苗 - 二 次 接种 ”(Vaccine-Second)、 主 题 8 “病毒 传播 -社会 >(Transmission-Social)、 
主题 5“ 疫 苗 接 种 态度 ”(Vaccine-Attitude )。 上 距离 原点 最 远 的 为 “病毒 变异 ” 

(Variant)， 该 主题 在 预 印 本 中 尤为 突出 ， 属 于 特有 的 热点 主题 ;其 次 为 “疫苗 - 
二 次 接种 ”(Vaccine-Second)， 这 两 个 主题 热度 与 影响 都 较 高 。 

期 刊 主题 如 图 5-2 所 示 。 相 较 预 印 本 主题 分 布 ， 期 刊 的 主题 分 布 更 加 分 散 。 

高 影响 低热 度 的 “经 典 主 题 ” 以 “疫苗 试验 ”(Vaccine-Trial) 为 代表 ， 与 预 印 本 

样 属于 疫苗 与 “预防 ”主题 ; 高 热度 低 影 响 的 “新 兴 主 题 ”* 以 “在 线 教育 ”C(Online 
Learning〉 为 代表 ， 相 较 于 预 印 本 更 偏向 “社会 ”层面 。 高 影响 高 热度 的 “热点 
主题 ” 相 较 预 印 本 数量 更 多 ， 且 存在 明显 远离 原点 的 主题 “疫苗 研制 ”(Vaccine- 
Development), 可 见 疫苗 相关 研究 无 论 在 预 印 本 还 是 期 刊 中 都 是 高 热度 高 影响 的 
“热点 主题 ”。 


预 印 本 主题 热度 -影响 分 布 


1.2 
transmission 
e 圭 -model 
0.8 
吓 全 
天 $ 
和 餐 vaccine 
0:4 
+ -second 
02 vaccine- 
ee rt development 
@ © 
-0.4 . ops 0.4 0.6 0.8 Y 1.2 


文献 影响 (AAS) 


图 5-1 预 印 本 主题 热度 -影响 分 布 
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期 刊 主 题 热 度 - 影 响 分 布 
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文献 影响 (AAS) 
5-2 期 刊 主题 热度 -影响 分 布 


实验 中 参考 PubMed 网 站 的 分 类 标准 , 把 主题 分 布 结果 归结 为 五 大 类 , 即 “ 传 
播 ”(Transmission)、 “预防 ”(Prevention)、“ 机 制 ”(Mechanism )、“ 治 疗 ” 
(Treatment)、“ 社 会 ”(Society) 五 大 类 。 五 大 主题 并 非 严 格 区 分 ， 而 是 存在 一 
定 的 关联 ， 如 研究 “传播 ”规律 对 于 “预防 ”有 帮助 ; 研究 病毒 “机 制 ” 有 助 于 
疫苗 和 药物 的 研制 ,分别 对 应 “预防 ”与 “治疗 ” 而 民众 对 竺 “预防 ”的 态度 、 
心理 健康 方面 的 “治疗 ””“ 传 播 ” 结 果 的 统计 等 ， 又 产生 “社会 ”层面 的 研究 主 
题 。 如 图 5-3 所 示 。 


图 5-3 COVID-19 大 类 主题 相互 关系 


6 总 结 讨论 

本 文采 用 BERTopic 模型 ,以 新 冠 疫情 主题 为 例 , 分别 对 来 自 bioRxiv、medRxiv 
的 预 印 本 文献 , 来 自 Scopus 的 期 刊 文献 , 从 热度 、 影 响 两 个 维度 进行 主题 分 析 。 
研究 获得 预 印 本 与 期 刊 各 自 偏好 的 热点 主题 , 并 参考 PubMed 网 站 的 分 类 标准 进 
行 归 类 , 在 对 比 中 发 现 其 潜在 的 规律 ,验证 了 预 印 本 与 期 刊 在 研究 内 容 方面 的 互 
补 。 通 过 归结 出 期 刊 与 预 印 本 在 不 同 维度 的 热点 主题 ， 对比 其 联系 与 区 别 ， 可 以 
得 出 以 下 结论 。 

(1) 从 热度 上 看 , 预 印 本 主题 更 偏向 病毒 传播 、 预防、 病理 机 制 等 医学 层面 ， 
且 “ 机 制 ”CMechanism) 大 类 相 较 期 刊 的 分 类 更 细致 ， 包 含 蛋白 质 、 基 因 组 等 主 
题 ; 期 刊 的 主题 兼 具 医 学 与 社会 层面 ， 且 “社会 ”(Society) 大 类 的 主题 分 类 更 细 
致 ， 包 含 在 线 教育 、 在 线 健 康 等 主题 ; 

(2) 从 影响 上 看 ， 以 疫苗 主题 为 代表 的 “预防 ”(Prevention) 大 类 在 预 印 本 
与 期 刊 中 都 占据 重要 地 位 ,尤其 是 在 预 印 本 文献 中 ;“ 传 播 ”(Transmission) 相关 
主题 则 在 期 刊 中 影响 力 较 大 ; 

(3) 预 印 本 与 期 刊 在 热度 和 影响 力 方面 有 部 分 重 回 主题 。 例 如 疫苗 相关 研 
究 , 无论 在 热度 维度 还 是 影响 维度 、 在 预 印 本 中 还 是 期 刊 中 ， 都 是 重要 的 研究 热 
点 主题 ， 总 体 来 看 在 影响 力 方 面 更 加 突出 ; 

《4) 预 印 本 中 有 期 刊 中 所 没有 的 特有 的 热点 主题 。 例如 病毒 变异 相关 研究 在 
预 印 本 主题 中 属于 高 影响 高 热度 的 热点 主题 ， 而 在 期 刊 中 不 够 显著 ， 可 以 视 作 预 
印 本 主题 的 特点 所 在 。 

总 体 来 看 ， 就 新 冠 疫 情 主题 而 言 ， 尽 管 期 刊 的 主题 较为 全 面 ， 预 印 本 仍 有 其 
特点 与 偏向 。 预 印 本 主题 更 偏向 理论 与 学 术 ， 而 期 刊 主题 更 偏向 实践 与 社会 ; 预 
印 本 主题 在 原理 方面 分 文 更 细致 ,而 期 刊 主题 在 社会 层面 涉及 面 更 广 , 二 者 在 内 
容 方 面 可 以 形成 有 效 互 补 。 对 此 ， 预 印 本 平台 可 以 更 多 地 鼓励 理论 创新 ,扬长 避 
短 ， 发 挥 预 印 本 速度 快 、 形 式 灵活 的 优势 ,在 内 容 方面 与 期 刊 进一步 差异 化 以 实 
现 学 术 交 流 上 的 分 工 合作 、 优 势 互 补 。 研究 人 员 可 以 发 挥 预 印 本 的 长 处 , 通过 其 
了 解 最 新 的 理论 创新 与 思想 火花 ， 更 好 地 发 挥 预 印 本 在 学 术 交 流 中 的 作用 。 
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